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EEEDBES AYANT TTNE ACTrVTTF. of, factrtip TYFr HANGF. nu r.np 
SEQIEMCES n-ACTOFS MIICLEIQUES ™" ant pottt? rv* ppnW r 

PREPARATION FT TTTTT IgAJJQM 

La presente invention conceme de nouvelles sequences peptidiques et 
nucleotidiques, et leur utilisation phamiaceutique. Plus particulierement. 1'invention 
conceme des peptides capables de moduler les niveaux d'echange du GDP sur des 
complexes p21-GDP. 

Les produits des genes ras, generalement designes proteines p21, jouent un 
role cle dans le controle de la division cellulaire chez tous les organismes eucaryotes 
ou ils ont ete recherches. Certaines modifications specifiques de ces proteines leur 
font perdre leur controle normal et les conduisent a devenir oncogeniques. Ainsi, un 
grand nombre de tumeurs humaines ont ete associees a la presence de genes ras 
modifies. De meme, une subexpression de ces proteines p21 peut conduire a un 
dereglement de la proliferation cellulaire. La comprehension du role exact de ces 
proteines p21 dans les cellules, de leur mode de fonctionnement et de leurs 
caracteristiques constitue done un enjeu majeur pour la comprehension et l'approche 
therapeutique de la cancerogenese. 

In vivo, on ne coimait pas encore la nature exacte des evenements 
responsables de l'activation des proteines p21. On sait qu'elles exercent leurs 
20 fonctions en oscillant entre deux etats conformationnels : une forme inactive liee au 
GDP et une forme active liee au GTP, mais les f acteurs agissant sur la transition entre 
ces deux formes ne sont pas clairement identifies. Des travaux recents rapportent des 
situations physiologiques.au cours desqueUes la proportion de proteines ras liees au 
GTP augmente dans la cellule. D s'agit de Tactivation des lymphocytes T et de la 
25 stimulation des f ibroblastes 3T3 par des f acteurs de croissance dont l'EGF et le PDGF 
(Downward et al., Nature m (1990) 719 ; Gibbs et al., J. Biol. Chem. 2& (1990) 
20437). L'augmentation de la proportion de p21-GTP peut s'expliquer au moins en 
partie par Taction d'une proteine jouant un role analogue a celui d'un recepteur pour 
les proteines G de transduction. A cet egard, certaines proteines capables de 
promouvoir l'echange du GDP sur les proteines P 21 ont ete identifiees, a partir de 
cerveau de boeuf [West et coll., FEBS Lett. 252 (1990) 245] et de rat [Wolfman et 
Macara, Science 242 (1990) 67]. La localisation cellulaire distincte de ces facteurs et 
les conditions experimentales tres differentes dans lesquelles ils ont ete obtenus 
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laissent supposer qu'U s'agit de proteines differentes. Files sont aussi actives sur Ies 
proteines ras normales que sur celles qui sont oncogeniques. Ces activites sont 
regroupees sous le terme de GEF : Facteur d'Echange des nucleotides Guanidiques 
ouGRF. 

Chez la levure Saccharomyces cerevisiae, l'activite GRF a ete attribuee au 
produit du gene CDC25 [Camonis et al., EMBO J. 5 (1986) 375], et des etudes ont 
ete realisees afin de comprendre la voie de signalisation faisant intervenir le produit 
des genes CDC25, RAS1 et RAS2 d'une part et l'adenylate cyclase d'autre part chez la 
levure Saccharomyces cerevisiae. En particulier, de nombreux travaux ont ete 
focalises sur la caracterisation du produit du gene CDC25 qui etait l'element le plus 
mal connu de cette chaine. Le produit du gene CDC25 constitue l'element le plus en ' 
amont de la cascade de reactions conduisant a l'activation de la p21 chez la levure. 
Les travaux realises dans ce domaine ont contribue a demontrer que le produit de ce 
gene devait agir comme facteur d'echange GDP -> GTP pour activer les proteines ras. 
Un second gene de la levure Sxerevisiae, SDC25, structurellement ties voisin de 
CDC25. a ete isole et caracterise. Le domaine actif de SDC25 semble etre un facteur 
d'echange capable d'agir in vitro et in vivo sur les proteines ras. Ce domaine constitue 
le premier constituant moleculaire decrit doue de cette activite. 

Tres recemment, une proteine de type GRF a ete egalement mise en 
evidence chez la souris [Vanoni et Martegani, J. Cell. Bioch. SuppL16B (1992) 220], 

Toutefois, jusqu'a aujourd'hui, aucune activite GRF n'a ete isolee et 
caracterisee chez l'homme. La presente invention resulte precisement de la 
demonstration par la demanderesse de texistence d'un facteur humain d'echange du 
GDP. La presente invention resulte plus particuUerement de l'identification, de 
l'isolement et de la caracterisation de peptides et de sequences nucleotidiques 
d'origine humaine, designes hGRF et hSOS, capables de moduler 1'etat d'activation 
des proteines p21. 

Un premier aspect de i'invention consiste done en des peptides utilisables 
pharmaceutiquement Plus pardculierement, un objet de I'invention reside dans des 
peptides capables de moduler les niveaux d'echange du GDP sur des complexes p21- 
GDP. II est entendu que p21 designe tout produit d'expression d'un gene ras normal 
ou oncogenique. 
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Plus paiticulierement. les peptides de Invention sont choisis parmi tout ou 
partie des sequences SEQ ID n° 2, 3, 4, 6 ou 8 ou d'un derive de celles-ci. 

Au sens de la presente invention, le terme derive designe toute molecule 
obtenue par modification de nature genetique et/ou chimique de ces sequences et 
conservant I'activite recherchee. Par modification de nature genetique et/ou chimique, 
on doit entendre toute mutation, substitution, deletion, addition et/ou modification 
tfun ou plusieurs residus. De tels derives peuvent etre generes dans des buts 
differents, tels que notamment celui d'augmenter 1'affinite du peptide pour son site 
d'interaction, celui d'ameliorer ses niveaux de production, celui d'augmenter sa 
resistance a des proteases, celui d'augmenter son efficacite therapeutique ou de 
reduire ses effets secondaires, ou celui de lui conferer de nouvelles proprietes 
pharmacocinetiques et/ou biologiques. 

Dans un mode particulier de l'invention, les peptides de Invention sont des 
peptides capables de stimuler l'echange du GDP sur le complexe p21-GDP. 

Dans un autre mode particulier de l'invention. les peptides de l'invention sont 
des peptides capables de ralentir ou d'inhiber l'echange du GDP sur le complexe p21- 
GDP. De tels peptides sont preferentiellement des peptides capables d'antagoniser 
Interaction du facteur d'echange du GDP avec le complexe p21-GDP. II peut done 
s'agir de fragments des sequences indiquees ci-dessus ou de derives de celles-ci. De 
tels fragments peuvent etre generes de differentes facons. En particulier, ils peuvent 
etre synthases par voie chimique, sur la base des sequences donnees dans la presente 
demande, en utilisant les synthetiseurs peptidiques connus de l'homme du metier. lis 
peuvent egalement etre synthetises par voie genetique, par expression dans un note 
cellulaire d'une sequence nucleotidique codant pour le peptide recherche. Dans ce 
cas. la sequence nucleotidique peut etre preparee chimiquement en utilisant un 
synthetiseur ribonucleotides, sur la base de la sequence peptidique donnee dans la 
presente demande et du code genetique. La sequence nucleotidique peut egalement 
etre preparee a partir des sequences donnees dans la presente demande (SEQ ID n° 1, 
5 et 7). par coupures enzymatiques. ligature, clonage, etc, selon les technique^ 
connues de l'homme du metier, ou par criblage de banques d'ADN avec des sondes 
elaborees a partir de ces sequences. Par ailleurs, les peptides de l'invention capables 
de ralentir ou d'inhiber l'echange du GDP sur le complexe p21-GDP peuvent 
egalement etre des peptides ayant une sequence corresponds au site d'interaction du 
facteur d'echange sur le complexe p21-GDP. 
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Un autre objet de l'invention reside dans des anticorps ou fragments 
d'anticorps polyclonaux ou monoclonaux diriges contre un peptide tel que defini 
ci-avant De tels anticorps peuvent etre generes par des methodes connues de 
l'homme du metier, compte tenu des enseignements donnes dans la presente 
5 demande. En particulier, ces anticorps peuvent etre prepares par immunisation d'un 
animal contre un peptide de l'invention, prelevement du sang, et isolement des 
anticorps, Ces anticorps peuvent egalement etre generes par preparation d'hybridomes 
selon les techniques connues de l'homme de Tart 

Plus preferentiellement, les anticorps ou fragments d'anticorps de 1'invention 
10 presentent la capacite d'inhiber au morns partiellement l'ihteraetion du facteur 
d'echange avec le complexe p21-GDP. lis peuvent ainsi etre utilises pour reguler 
Tetat d'activation du produit des genes ras. 

Par ailleurs, ces anticorps peuvent egalement etre utilises pour detecter et/ou 
doser le facteur d'echange du GDP humain dans desechantillons biologiques, et de ce 
15 fait, pour renseigner sur I'etat d'activation du produit des genes ras. 

La presente invention permet done de generer des peptides derives des 
sequences SEQ ID n° 2-4, 6 et 8, ainsi que des anticorps diriges contre ces peptides, 
presentant des proprietes biologiques interessantes en vue tfune utilisation 
pharmaceutique. L'activite biologique des differents peptides et anticorps de 

20 Tinvention sur Techange du GDP peut etre evaluee de differentes fagon ainsi 
qu'illustre dans les exemples. 

L'invehtion fournit egalement des composes non peptidiques ou non exclu- 
sivementpeptidiques utilisables pharmaceutiquement. II est en effet possible, a partir 
des motifs proteiques actifs decrits dans la presente demande, de realiser des 

25 molecules inhibitrices de la voie de signalisation dependante des proteines ras non 
exclusivement pqrtidiques et compatibles avec une utilisation pharmaceutique. A cet 
egard, Finvention concerne Tutilisation d'un polypeptide de l'invention tel que decrit 
ci-avant pour la preparation de molecules non-peptidiques r ou non exclusivement 
peptidiques, actives pharmacologiquement sur les niveaux d'echange du GDP, par 

30 determination des elements structuraux de ce polypeptide qui sont importants pour 
son activite et reproduction de ces elements par des structures non-peptidiques ou 
non exclusivement peptidiques. L'invention a aussi pour objet des compositions 
pharmaceutiques comprenant une ou plusieurs molecules ainsi preparees. 
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La presente invention a egalement pour objet toute sequence d'acide 
nucleique codant pour un polypeptide tel que defini ci-dessus. Plus preferentiel- 
lement, il s'agit d'une sequence choisie parmi : 

(a) tout ou partie des sequences SEQ ID n° 1, 5 ou 7 ou de leur brin 
compiementaire, 

(b) toute sequence hybridant avec une sequence. (a) et codant pour un 
polypeptide selon 1'invention, et 

(c) les sequences derivees des sequences (a) et (b) en raison de la 
degenerescence du code genetique. 

Les differentes sequences nucleotidiques de 1'invention peuvent etre 
d'origine artificielle ou non. II peut s'agir de sequences genorniques, d'ADNc, d'ARN, 
de sequences hybrides ou de sequences synthetiques ou semi-synthetiques. Ces' 
sequences peuvent etre obtenues par exemple par criblage de banques d'ADN (banque 
d'ADNc, banque d'ADN genomique) au moyen de sondes elaborees sur la base des 
sequences SEQ ID n' 1, 5 ou 7. De telles banques peuvent etre preparees a oartir de 
cellules de differentes origines par des techniques classiques de biologie moleculaires 
connues de l'homme du metier. Les sequences nucleotidiques de 1'invention peuvent 
egalement etre preparees par synthese chimique, notamment selon la methode des 
phosphoramidites. ou encore par des methodes mixtes incluant la modification 
chimique ou enzymatique de sequences obtenues par criblage de banques. 

Ces sequences nucleotidiques selon 1'invention sont utilisables dans le 
domaine pharmaceutique, soil pour la production in vitro des peptides de 1'invention, 
soit pour la realisation de sequences antisens ou pour la production des peptides de 
1'invention dans le cadre d'une therapie genique, soit encore pour la detection et le 
diagnostic, par des experiences d'hybri-dation, de l'expression ou d'une surexpression 
d'un facteur d'echange du GDP amplifie, mute ou rearrange dans des echantillons 
biologiques ou pour 1'isolement de sequences homologues a partir d'autres sources 
cellulaires. 



30 



Pour la production des peptides de 1'invention, les sequences nucleiques 
definies ci-dessus sont generalement placees sous le controle de signaux permettant 
leur expression dans un hote ceUulaire. Le choix de ces signaux (promoteurs, 
terminateurs, sequence "leader" de secretion, etc) peut varier en fonction de l'hote 
ceUulaire utilise. Preferentiellement, ces sequences nucleotidiques de 1'invention font 
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partie d'un vecteur, qui peut etre a replication autonome ou integratif. Plus particulie- 
rement, des vecteurs a replication autonome peuvent etre prepares en utilisant des 
sequences a replication autonome chez l*hote choisi. S'agissant des vecteurs 
integratifs, ceux-ci peuvent etre prepares par exemple en utilisant des sequences 
homologues a certaines regions du genome de l*hdte, permettant, par recombinaison 
homologue, l'integration du vecteur. 

Les hdtes cellulaires utilisables pour la production des peptides de 
1'invention sont aussi bien des hotes eucaryotes que procaryotes. Parmi les hotes 
eucaryotes qui conviennent, on peut citer les cellules animales, les levures, ou les 
champignons. En particulier, s'agissant de levures, on peut citer les levures du genre 
Saccharomyces, Kluyveromyces, Pichia, Schwanniomyces, ou Hansenula. S'agissant. 
de cellules animales, on peut citer les cellules COS, CHO, C127, etc. Parmi les 
champignons, on peut citer plus particulierement Aspergillus ssp. ou Trichoderma 
ssp. Comme hotes procaryotes, on prefere utiliser les bacteries suivantes Kcoli, 
Bacillus, ou Streptomyces. 

Les sequences d'acides nucleiques selon 1'invention peuvent egalement servir 
a la realisation d'otigonuclebtides antisens ou d'antisens genetiques utilisables comme 
agents pharmaceutiques. L'inhibition de l'expression de certains oncogenes par des 
sequences antisens s'est averee etre une strategic utile dans la comprehension du role 
de ces oncogenes et une voie particulierement prometteuse dans la realisation d'un 
traitement anticancereux. Les sequences antisens sont des oligonucleotides de petite 
taille, complementaire du brin codant d'un gene donne, et de ce fait capables 
d'hybrider specifiquement avec l'ARNm transcrit, inhibant sa traduction en proteine. 
L'invention a ainsi pour objet les sequences antisens capables d'inhiber au moins 
partiellement la production de peptides stimulant 1'echange du GDP sur des 
complexes p21-GDP. De telles sequences peuvent etre constituees par tout ou partie 
des sequences nucleiques def inies ci-avant II s'agit generalement de sequences ou de 
fragments de sequences complementaires de sequences codant pour des peptides 
stimulant Techange du GDP. De tels oUgonucleotides peuvent etre obtenus a partir 
des sequences SEQ ID n° 1, 5 ou 7, par fragmentation, etc, ou par synthese chimique. 
De telles sequences peuvent etre utilisees dans le cadre de therapies geniques, pour le 
transf ert et l'expression in vivo de sequences antisens. ou de peptides capables de 
moduler les niveaux d'echanges du GDP sur TeVproteines ras. A cet egard, les 
sequences peuvent etre incorporees dans des vecteurs, notamment d'origine virale. 
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L'invention concerne egalement, comme sequences nucleotidiques, les 
sondes nucleotidiques. synthetiques ou non, capables de s'hydrider avec les sequences 
nucleotidiques definies ci-avant qui codent pour un peptide de l'invention, ou avec 
l'ARNm conespondant De telles sondes peuvent etre utilisees in vitro comme outil 
de diagnostic, pour la detection de l'expression du facteur d'echange du GDP, ou 
encore pour la raise en evidence d'anomalies genetiques (mauvais epissage, 
polymorphisme, mutations ponctuelles, etc). De telles sondes doivent etre 
prealablement marquees, et pour cela differentes techniques sont connues de lTiomme 
du metier. Les conditions d'hybridation dans lesquelles ces sondes peuvent etre 
utilisees sont les conditions normales de stringence (voir notamment les techniques 
generates de clonage ci-apres ainsi que les exemples), Ces sondes peuvent egalement 
etre utilisees pour la raise en evidence et l'isolement de sequences d'acides nucleiques 
homologues codant pour un peptide de l'invention, a partir d'autres sources 
cellulaires, ainsi qu'illustre dans les exemples. 

L'invention a encore pour objet toute composition pharmaceutique 
comprenant comme principe actif au moins un peptide tel que defini ci-avant 

EUe a aussi pour objet toute composition pharmaceutique comprenant 
comme principe actif au moins un anticorps et/ou un fragment d'anticorps tel que 
defini ci-avant, ainsi que toute composition pharmaceutique comprenant comme 
principe actif au moins une sequence nucleotidique telle que definie ci-avant 

Par ailleurs, elle a aussi pour objet les compositions pharmaceutiques dans 
lesquelles les peptides, anticorps et sequence nucleotidique definis ci-avant sont 
associes entre-eux ou avec d'autres principes actif s. 

Les compositions pharmaceutiques selon l'invention peuvent etre utilisees 
pour moduler l'activation des proteines p21 et de ce fait pour moduler la proliferation 
de certains types cellulaires. Plus particulieremem, ces compositions pharmaceutiques 
sont destinies au traitement de cancers. De nombreux cancers ont en effet ete 
associes a la presence de proteines ras oncogeniques. Parmi les cancers renfermant le 
plus souvent des genes ras mutes, on peut citer notamment les adenocarcinomes du 
pancreas, dont 90 % ont un oncogene Ki-ras mute sur te douzieme codon [Almoguera 
et coll.. Cell 53. (1988) 549], les adenocarcinomes du colon et les cancers de la 
thyroide (50 %), ou les carcinomes du poumon et les leucemies myeloides [30 %, 
Bos, J.L. Cancer Res. 49 (1989) 4682]. 
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L'invention a encore pour objet rutilisation des molecules decrites ci-avant 
pour moduler l'activite des proteines p21. En particulier, l'invention conceme 
l'utilisation de ces molecules pour inhiber au moms partieliement 1'activation des 
proteines p21. 

L'invention fournit egalement un procede de detection de l'expression et/ou 
d'une surexpression d'un gene ras dans un echantillon biologique. Un tel procede 
comprend par exemple la mise en contact d'un tel echantillon avec un anticorps ou 
fragment d'anticorps selon l'invention, la revelation des complexes antigene- 
anticorps, et la comparaison des resultats obtenus avec un echantillon standard. Dans 
un tel procede, l'anticorps peut etre en suspension ou prealablement immobilise sur 
un support Ce procede peut egalement comprendre la mise en contact de l'echantillon 
avec une sonde nucleotidique selon l'invention, la mise en evidence des hybrides 
obtenus, et la comparaison avec ceux obtenus dans le cas d'un echantillon standard. 

La presente invention peut etre utilisee dans le domaine therapeutique : les 
peptides, anticorps et sequences nucleotidiques de l'invention etant capables de 
moduler l'activite des genes ras. ils permettent en effet d'intervenir dans le processus 
de developpement des cancers. Ainsi qu'illustre dans les exemples, les sequences 
nucleotidiques de l'invention permettent notamment d'exprimer des peptides capables 
de complementer la thermosensibilite de levures portant une mutation cdc25. EUes 
permettent egalement d'exprimer des peptides capables de supprimer une mutation 
dominante RAS2ts. demontrant une competition avec le produit normal d'expression 
du gene CDC25 pour rinteraction avec les proteines p21. L'invention peut egalement 
etre utilisee dans le domaine du diagnostic et du typage de cancers : les anticorps et 
sondes nucleotidiques de l'invention permettent en effet l'identification des cancers 
dans lesquels un gene ras est implique ainsi que le diagnostic de cancers lies a la 
surexpression d'un gene ras normal ou oncogenique. 

D'autres avantages de la presente invention apparaitront a la lecture des 
exemples qui suivent, qui doivent etre consideres comme illustratif s et non limitatif s. 

Legends fefjgig^ 

Figure 1 :Test de transactivation r Cette figure presente en ordonnee les niveaux 
d'activite CAT (% par rapport au bruit de fond) des souches CHO recombinantes, en 
fonction de la sequence d'ADNc utilisee pour la transformation. 
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Figure 2 : Test d'activite d'echange du OTP : Cette figure preseme en ordonnee le 
rapport des formes P 21-GDP/p21-GTP des souches CHO recombinantes, en fonction 
de la sequence d'ADNc utilisee pour la transformation. 

Figure 3 : Test d'activite d'echange du GDP in vitro : Cette figure montre, en fonction 
du temps et pour 2 concentrations d«un peptide de l'invention, la diminution de la 
proportion de GDP rstant lie a la proteine p21. 

Technioues vent™^ df rbnnrr 

Les methodes classiquement utilisees en biologie moleculaire telles que les 
extractions preparatives d'ADN plasmidique. la centrifugation d'ADN plasmidique en 
gradient de chlorure de cesium. 1'electrophorese sur gels d'agarose ou d'acrylamide la 
purification de fragments d'ADN par electrocution, les extractions de proteines au 
phenol ou au phenol-chloroforme. la precipitation d'ADN en milieu salin par de 
l'ethanol ou de l'isopropanol. la transformation dans Escherichia coli, etc, sont bien 
connues de 1'homme de metier et sont abondament decrites dans la literature 
[Maniatis T. et al., "Molecular Cloning, a Laboratory Manual", Cold Spring Harbor 
Laboratory, Cold Spring Harbor, N.Y., 1982; Ausubel F.M. et al. (eds), "Current 
Protocols in Molecular Biology", John Wiley & Sons, New York, 1987]. 

V* enz > rmes de restriction ont ete fournies par New England Biolabs 
(Biolabs). Bethesda Research Laboratories (BRL) ou Amersham et sont utilisees 
selon les recommandations des foumisseurs. 

Les plasmides de type pBR322, P UC, Xgtll, pGEX 2T et les phages de la 
sene M13 sont d'origine commerciale. 

Pour les ligatures, les fragments d'ADN sont separes selon leur taiUe par 
electrophorese en gels d'agarose ou d'acrylamide. extraits au phenol ou par un 
melange phenoVchloroforme. precipites a l'ethanol puis incubes en presence de 
I ADN hgase du phage T4 (Biolabs) selon les recommandations du foumisseur. 

Le remplissage des extremites 5' proeminentes est effectue par le fragment de 
Klenow de I'ADN Polymerase I d'E coli (Biolabs) selon les specifications du 
foumisseur. La destruction des extremites 3' proeminentes est effectuee en presence 
de I'ADN Polymerase du phage T4 (Biolabs) utilisee selon les recommandations du 
fabneant La destruction des extremites 5' proeminentes est effectuee par un 
traitement menage par la nuclease SI. 
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La mutagenese dirigee in vitro par ohgodeoxynucleotides synthetiques est 
effectuee selon la methode developpee par Taylor et al. [Nucleic Acids. Res. U 
(1985) 8749-8764] en utilisant le kit distribue par Amersham. 

^amplification enzymatique de fragments d'ADN par la technique dite de 
PCR [Eolymerase-catalyzed £hain fceaction, Saiki R.K. et al.. Science 22fl (1985) 
1350-1354 ; Mullis KB. et Faloona F.A. Meth. Enzym. 155 (1987) 335-350] est 
effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer Cetus) selon les 
specifications du fabricant 

La verification des sequences nucleotidiques est effectuee par la methode 
developpee par Sanger et al. [Proc. Natl. Acad, ScL USA, 74 (1977) 5463-5467] en 
utilisant le kit distribue par Amersham. 

Pour les experiences d'hybridation, les conditions de stringence normales sont 
generalement les suivantes : hybridation : 3 x SCC en presence de 5 x Derihart's a 
65°C; lavage: 0,5 xSSC a 65°C. 

L ISOlement <in Pen* du factenr Immain d'echan f P H„ QDP (hrtRn 

5.105 phages d'une banque de cerveau humain construite dans le vecteur 
Xgtll [Skolnik et al., Cell£5 (1991) 83] ont ete cribles selon les techniques derates 
par Sambrook, Fritsch et Maniatis (Molecular cloning ; Cold Spring Harbor 
Laboratory Press ; 1989). 

La sonde utilisee pour le criblage de cette banque est un fragment d'ADNc 
humain de 137 paires de bases marque au 32p. Ce tte sonde a ete preparee par PCR sur 
l'ADN total de la banque precitee en utilisant comme amorces les oUgonucleotides 
degeneres suivants : 

-ATC CGT CAG GTA CAT CCC CAG GTA TGG CAC ACA 
25 T T T T T T 

A A A A G A 

G G G 

pour 1'oUgonucleotide de l'extremite 3' du fragment, et 

-GCA ATT TTT CGG CTT AAG AAG ACT TGG 
30 TC C AC A A C 

C A T G A 

G C A G 

pour l'oligonucleotide de l'extremite 5' du fragment. 
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La sonde a ete marquee au 32p par "random priming" selon la technique de 
Feinberg et Vogelstein [Anal. Biochem. 127 (1984) 266], et la reaction de PCR a ete 
menee a 40°C environ dans les conditions decrites dans les techniques generales de 
clonage. 

Parmi les differents clones positif s obtenus par hybridation avec cette sonde, 
un comprend la totalite d'une phase ouverte qui porte l'activite d'echange vis-a-vis de 
Ha-Ras. 

Ce clone de Xgtll contient un ADNc de 3 kb qui a ete introduit, sous forme 
d'un fragment EcoRI, au site correspondant d'un vecteur M13mpl8. Cet ADNc a 
ensuite ete sequence a l'aide des amorces commerciales "reverse" et "-20" ainsi qu'a 
1'aide ^oligonucleotides specifiques selon la technique de Sanger (Cf techniques 
generales de clonage). 

La sequence nucleotidique du gene du facteur humain d'echange du GDP 
porte par le fragment ainsi obtenu est presentee sur la sequence SEQ ID n° 1, ainsi 
que les sequences peptidiques deduites (SEQ ID n° 2, 3 et 4). 

3, Preparation dp sous fragm^ 

Differents drives ou fragments du gene ainsi obtenu peuvent etre prepares 
et utilises, notamment pour regression de peptides de Invention. En particulier, les 
fragments suivants ont ete prepares par coupure enzymatique, et separes par 
20 electroelution : 

- un fragment Pstl-EcoRI comprenant une partie de la region codante du facteur 
d'echange (du nucleotide 936 jusqu'au codon stop) ainsi que la region 3' non codante 
du fragment, 

- un fragment EcoNI-EcoRI comprenant une partie de la region codante du facteur 
d'echange (du nucleotide 910 jusqu'au codon stop) ainsi que la region 3' non codante 
du fragment, 

- un fragment Eagl-EcoRI comprenant une partie de la region codante du facteur 
d'echange (du nucleotide 638 jusqu'au codon stop) ainsi que la region 3' non codante . 
du fragment, 

- un fragment Ball-EcoRI comprenant une partie de la region codante du facteur 
d'echange (du. nucleotide 88 jusqu'au codon stop) ainsi que la region 3' non codante 
du fragment, et, 
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- un fragment Nael-EcoRI comprenant tine partie de la region codante du facteur 
d'echange (du nucleotide 196 jusqu'au codon stop) ainsi que la region 3' non codante 
du fragment, 

II est entendu que la region 3' non codante portee par ces fragments est 
5 accessoire et qu'elle peut etre eliminee, soit par digestion au moyen d'une nuclease, 
soit par coupure avec une enzyme ayant un site proche du codon stop, telle que 
notamment Smal, dont le site est localise environ 30 pb apres le codon stop. 

II est entendu egalement que d'autres fragments peuvent etre prepares, tels 
que notamment des fragments ne contenant pas la region codant pour la partie 
10 C-terminale entiere, ainsi que des derives de ces fragments, obtenus par mutation, 
substitution, addition, ou modification de nature chimique et/ou genetique. 

3. Caracterisation hiolngjg^ 

Les fonctionnalites des peptides selon rinvention ont ete testees : 
15 - dans des cellules mammiferes, 

- dans la levure Saccharomyces cerevisiae, ou encore 

- in vitro sur la proteine Ha-Ras recombinante. 

3.1. Pour revaluation fonctionnelle dans les cellules mammiferes, les 
sequences d'ADN codant pour des peptides de Invention, tels que par exemple ceux 
20 decrits dans Fexemple 2, peuvent etre placees sous controle du promoteur precoce de 
SV40 dans le vecteur pCyml decrit par Camonis et al. [Gene fig (1990) 263], 

Dans cet exemple, les fragments Pstl-EcoRI et EcoNI-EcoRI decrit dans 
Texemple 2 ont ete inseres dans ce vecteur. 

Les vecteurs ainsi obtenus ont ete testes par transf ection transitoire dans des 
25 cellules CHO selon le protocole decrit par Rey et al. [Oncogene ^ (1991) 347]. 
Deux criteres de fonctionnalite ont ainsi ete etudies : 

- la capacite des vecteurs a transactiver un promoteur gouvemant Texpression d'un 
gene reporteur qui est ici le gene bacterien codant pour la chloramphenicol acetyl 
transferase (gene CAT), 

30 - leur capacite a promouvoir la charge en GTP des proteines Ras des cellules CHO 
transfectees. 

a) Pour les tests de transactivation r des cellules CHO a 50 % de confluence 
ont ete transfectees (voir par exemple le protocole decrit par Schweighoffer et al. 
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Science, In Press) d'une part avec 0,5 jig d'un vecteur portant le gene CAT sous 
controle d'un promoteur synthetique compose du promoteur murin du gene de la 
thymidine kinase et de 4 elements PEA1 repetes derives de l'enhancer du polydme 
[Wasylyk et aL, EMBO J. 7 (1988) 2475], et d'autre part avec 4,5 fig d'un vecteur 
d'expression portant, sous controle du promoteur precoce de SV40, aucun ADNc 
codant (piste 1). l'ADNc de Ha-Ras normal (piste 2), 1'ADNc de Ha-Ras active en 12 
(Val 12) (piste 3), l'extremite 3' du cDNA de SDC25 decrite par Rey et al. precitee 
(piste 4), et l'ADNc codant pour un peptide selon l'invention decrit ci-dessus (piste 5). 

Les resultats sont presentes sur la figure 1. La piste 1 correspondant a 
l'activation basale, la piste 3 (obtenue pour le fragment Pstl-EcoRI : CDC hum.) 
montre que I'expression d'un peptide de l'invention permet la transaction du 
promoteur synthetique utilise. 

Le meme resultat qualitatif a ete obtenu pour les autres fragments etudies. 

b) De facon a verifier que cette transactivation implique bier une charge 
nucleotidique des proteines ras des cellules CHO, les memes transfections transitoires 
out ete realisees, le milieu de culture etant additionne d'orthophosphate marque au 

Ce protocole de marquage ainsi que celui de l'immunoprecipitation des 
proteines ras cellulaires est decrit par Rey et al. precitee. Les resultats obtenus sont 
presentes sur la figure 2. lis montrent que les peptides de l'invention sont capables de 
moduler les niveaux d'echange du GDP sur les proteines ras puisque certains d'entre- 
eux (peptide CDC Hum. exprime par le fragment Pstl-EcoRI decrit ci-avant) sont 
capables de promouvoir la charge en GTP des proteines ras de cellules CHO 
immunoprecipitees par l'anticorps Y 13-259. 

3.2. Les peptides de l'invention ont egalement ete testes fonctionnellement 
dans la levure S.cerevisiae cdc25-. Pour cela, les vecteurs decrits precedemment 
(3.1.), qui sont des vecteurs navettes, ont ete introduits dans la souche de levure 
OL97-1-11B [Camonis et Jacquet, MoL Cell. Biol, fi (1988) 2980]. Les resultats 
obtenus montrent que les fragments d'ADNc selon l'invention codent pour des 
peptides qui sont capables de complementer le defaut de croissance de cette souche a 
36°C. Ces resultats montrent ainsi que ces fragments codent pour des peptides 
fonctionnels in vivo dans Sxerevisiae. 
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3.3. La capacite des sequences d'ADN de l'invention a coder pour des 
peptides capables de promouvoir l'echange du GDP sur des proteines Ha-Ras 
purifiees a egalement ete demontree in vitro selon le protocoie decrit par Rey et al. 
Mol. Cell. BioL 2 (1989) 3904]. 

Pour cela les sequences de l'invention sont exprimees dans la souche d'Ecoli 
TGI sous forme de proteines de fusion avec la glutathion S-transferase (GST) selon 
la technique decrite par Smith et Johnson [Gene QL (1988) 31]. Pour cela, les 
differents fragments d'ADN decrits en 3.1. ci-dessus ont ete clones, sous forme de 
fragments Smal-EcoRI, dans le vecteur pGEX 2T (Pharmacia), en 3' et en phase d'un 
ADNc codant pour la GST. Les fragments Smal-EcoRI sont obtenus par ajout d'un 
adaptateur au moyen dune ligase. Les vecteurs ainsi obtenus sont ensuite utilises 
pour transformer la souche Ecoli TGI. Les cellules ainsi transformer sont 
precultivees une nuit a 37°C, diluees au l/10e dans du milieu LB, ajoutees d'IPTG 
pour induire l'expression (2 heures, 25°C), puis cultivees 21 heures environ a 25°C. 
Les cellules sont ensuite lysees. et les proteines de fusions produites sont purifiees par 
affinite sur colonne Agarose-GSH. Pour cela, le lysat bacterien est incube en 
presence du gel (prepare et equilibre avec le tampon de lyse) pendant 15 minutes a 
4°C. Apres 3 lavages avec un tampon Tris-HCl pH 7,4, les proteines sont eluees en 
presence d'un tampon Tris-HCl pH 7,7 contenant un exces de .GSH. Le surnageant est 
20 recolte et centrifuge. 

L'activite d'echange du GDP des peptides de l'invention sur des proteines 
Ha-Ras purifiees a ensuite ete demontree in vitro selon le protocoie decrit par Rey et 
al. (Mol. Cell. BioL precitee). Les resultats obtenus sont presentes sur la figure 3. Us 
montrent notamment que le peptide de l'invention correspondant a la sequence CDC 
hum exprimee pae le fragment Pstl-EcoRI decrit ci-avant stimule l'echange du GDP. 

4. Mise en evidennp riftgj foiences hnmnlngiiPg 

Des sequences d'acides nucleiques homologues a ceUe presentee sur la figure 
1 ont ete mises en evidence par deux strategies differentes : 

- par PCR, dans les conditions decrites dans les techniques generales de ■ 
clonage, sur des ADNc neosynthetises a partir d'ARNm de placenta, en utilisant 
comme amorces des ohgonucleotides degeneres choisis pour recouvrir des sequences 
conservees entre la sequence SEQ ID n°l et la sequence de la proteine SOS [Bonfini 
et al., Science 255 (1992) 603]. 
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- Par criblage d'une banque d'ADNc de placenta a l'aide d'une sonde 
constitute par la totalite de la sequence SEQ ID n°l marquee au 32 P . Ce criblage a 
cete realise dans des conditions de faible stringence : hybridation a 50°C en milieu 5 x 
SSC, 5 x Denhart's; puis lavage a 50°C en milieu 2 x SSC. 

5 Ces deux strategies ont permis de reveler des sequences homologues a la 

sequence SEQ ID n°l. Ces sequences peuvent etre aisement isolees et caracterisees. 
Elles constituent des sequences nucleiques au sens de la presente invention, 
lorsqu'elles cedent (ou leurs fragments ou derives) pour des peptides capables de 
moduler les niveaux d'echanges du GDP sur des complexes p21-GDP. 

10 En particulier, cette strategie a permis Identification, a partir d'ARNm de 

placenta et en utilisant les oligonucleotides oligo 2449 (SEQ ID n° 9) et oligo 2451 
(SEQ ID n° 10), de 2 ADNc codant pour des facteurs designes hSOSl et hSOS2, 
dont les sequences partielles sont representees sur les SEQ ID n° 5 et SEQ ID n° 7 
respectivement Les ARNm correspondant a ces facteurs sont presents dans tous les 

15 tissus dans lesquels ils ont ete recherches, contrairement au facteur decrit dans 
l'exemple 1 qui sembie localise uniquement dans le cerveau. La localisation 
chromosomique de ces genes a ete effectuee et a donne les resultats suivants : 

- h-GRF :15q2.4. 

- h-SOSl : 4q2.1. 
20 -h-SOS2:14q2.2. 

5, Rgcherchft de facteurs ri'ftrhange de tvps h.ft RF dans d'aiifrre fa m 

Un anticorps and h-GRF a ete prepare chez le lapin, par immunisation avec 
un antigene correspondant au fragment de 280 acides amines localise entre les residus 
211 et 489 du facteur h-GRF presente sur la SEQ ID n° 4. 

25 Cet anticorps a permis la detection, par ELISA, dans du cortex humain et 

des cellules precurseur du cerveau, de proteines de poids moleculaires apparents 30, 
55, 75, 95 et 140 kDa. La diversite des poids moleculaires suggere la presence 
d'ADNc multiples. La preincubation de 1'anticorps anti h-GRF avec le h-GRF 
supprime la detection des proteines identifiees, ce qui demontre la specificite du 

30 signal. 
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(1) INFORMATION GENERALE: 



(i) DEPOSANT : 

(A) NOM: RHONE-POULENC RORER S.A. 

(B) RUE: 20 , avenue Raymond ARON 

(C) VILLE: ANTONY 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 92165 

™™J££L TJTBE DE L r INVENTION r PEPTIDES INHIBANT L'ACTIVITE DES 
PROTEINES RAS, PREPARATION ET UTILISATION ^ 

(iii) NOMBRE DE SEQUENCES: 10 

<iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Tape 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D 1 EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 



25 (2) INFORMATION POUR LA SEQ ID NO:. 1 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2652 paires de baser; 

(B) TYPE: acide nucleque 

30 (C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineire 

(ii) TYPE DE MOLECULE: ADNc 

35 (iii) HYPOTHETIQUE: NON 

(iii) ANTI-SENS : NON 

40 (ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..2445 

(ix) CARACTERISTIQUE ADDITIONELLE: 
45 (A) NOM/CLE: CDS 



(B) EMPLACEMENT: 445.-2445 (SEQ ID NO 3) 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 976.-2445 (SEQ ID NO 4) 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: .1 : 



55 GGC GAT GGC TGT AAG ATC CTC CTG GAC ACC AGC CAG ACC TTT GTG AGA 48 
Gly Asp Gly Cys Lys He Leu Leu Asp Thr Ser Gin Thr Phe Val Ara 
1 5 TO 15 

60 ?ft rw c CC r T ° ^ T ^ G GTG CCC ATG TCT GAA GGC AAG ATC ACC 96 

60 Gin Gly Ser Leu He Gin Val Pro Met Ser Glu Lys Gly Lys He Thr 

20 25 30 

AGG GGG CGC CTG GGG TCT CTC TCC CTA. AAG AAA GAG GGC GAG CGA CAG 144 
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55 



60 



Arg Gly Arg Leu Gly Ser Leu Ser Leu Lys Lys Glu Gly Glu Arg Gin 
J5 40 45 

Phf T CTG ^ T ^ CT ^ G CTG ATT ATC TGT ACC AGA GGC TCT GGA 

Cys Phe Leu Phe Ser Lys His Leu He He Cys Thr Arg Gly Ser Gly 
50 55 60 " 

GGG AAG CTT CAC TTG ACC AAG AAT GGA GTC ATA TCC CTC ATT GAC TGC 
Gly Lys Leu His Leu Thr Lys Asn Gly Val lie Ser Leu lie Asp Cys 
65 7 ° 75 " |o 



ACT TTA TTG GAG GAG CCA GAA AGC 
Thr Leu Leu Glu Glu Pro Glu Ser 
85 

GGC CAA GAC ATA GAT CAC TTG GAT 
Gly Gin Asp He Asp His Leu Asp 
100 

GAT TCC CCG CCC TTT ACA GTC ATC 
Asp Ser Pro Pro Phe Thr Val He 
115 120 



ACG GAG GAG GAA GCC AAA GGA TCC 
Thr Glu Glu Glu Ala Lys Gly Ser 
90 95 

TTT AAA ATC GGG GTG GAG CCA AAG 
Phe Lys He Gly Val Glu Pro Lys 
105 no 

CTA GTG GCC TCG TCC AGA CAG GAG 
Leu Val Ala Ser Ser Arg Gin Glu 
125 



AAG GCA GCG TGG ACC AGT GAC ATC AGC CAG TGT GTT GGT AAC ATC CGA 
25 Lys Ala Ala Trp Thr Ser Asp He Ser Gin Cys Val Asn He Ar^ 
,JU 135 140 

^ ^ T GGG ? TC ATG ATG ^ CCA TTT GAA GAA AAT TCC AAG GTC ACT 
30 fig ^ Gly LSU Met L * s Pro Phe G1 » Glu Asn Ser Lys Val Thr 

150 155 



GTG CCG CAG ATG ATC AAG TCC GAC 
Val Pro Gin Met lie Lys Ser Asp 
165 

GAC ATT CGC TTC AGC AAA ACC ATG 
Asp He Arg Phe Ser Lys Thr Met 
180 

GCC TAC GCC AGT GTG GAG CGG CTG 
Ala Tyr Ala Ser Val Glu Arg Leu 
195 200 



GCC TCC TTA TAT TGT GAT GAT GTT 
Ala Ser Leu Tyr Cys Asp Asp Val 
170 175 

AAC TCC TGC AAA GTG CTG CAG ATC 
Asn Ser Cys Lys Val Leu Gin He 
185 190 

CTG GAG AGG CTG ACG GAC CTG CGC 
Leu Glu Arg Leu Thr Asp Leu Arg 
205 



TTC CTG AGC ATC GAC TTC CTC AAC ACC TTC CTG CAC TCC TAC CGC GTC 
Phe Leu Ser He Asp Phe Leu Asn Thr Phe Leu Ss Ser ■*£ Arg Val 
ZIU 215 220 

11° £F f GCC ATC GTG GTC CTG Q AC AAG CTC ATT ACC ATC TAC AAG 
Phe Thr Thr Ala lie Val Val Leu Asp Lys Leu He Thr He i£ JJ5 

230 235 240 



AAG CCT ATC AGT GCC ATT CCT GCC 
Lys Pro He Ser Ala He Pro Ala 
245 

AGT GGC CAG AAC AAT AAG CTC CTG 
Ser Gly Gin Asn Asn Lys Leu Leu 
260 

CGC GCC ACC CGC AAG TTC TCC TCG 
Arg Ala Thr Arg Lys Phe Ser Ser 
275 " 280 



AGG TCG CTG GAG CTC CTG TTT GCC 
Arg Ser Leu Glu Leu Leu Phe Ala 
250 255 

TAC GGT GAA CCC CCC AAG TCC CCG 
Tyr Gly Glu Pro Pro Lys Ser Pro 
265 270 

CCG CCA CCT CTG TCC ATC ACC AAG 
Pro Pro Pro Leu Ser He Thr Lys 
285 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 
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ACA TCG TCA CCG AGC CGC CGG CGG AAG CTC TCC CTG AAC ATC CCC ATC 
Thr Ser Ser Pro Ser Arg Arg Arg Lys Leu Ser Leu Asn S Pro 2 

295 300 

2 T*S gS S J5f f?^ f AC T CTG G ? C GCC 010 AGC TGC TCC 
xje ittr Gly Gly Lys Ala Leu Asp Leu Ala Ala Leu Ser Cys Asri Ser 

310 315 320 

AAT GGC TAC ACC AGC ATG TAC TCG GCC ATG TCA CCC TTC AGC AAG GCC 
Asa Gly Tyr Thr Ser Met Tyr Ser Ala Met Ser Pro pS Ser £y*s Sa 
325 330 335 

ACG CTG GAC ACC AGC AAG CTC TAT GTG TCC AGC AGC TTC ACC AAC AAC 
Thr Leu Asp Thr Ser Lys Leu Tyr Val Ser Ser Ser £ £ 
340 345 350 

ATT CCA GAT GAG GGC GAT ACG ACC CCT GAG AAG CCC GAA GAC CCT TCA 
lie Pro Asp Glu Gly Asp Thr Thr Pro Glu Lys Pro Glu Asp Pro Ser~ 

360 365 

S S° S C ^ G AGC TCA GAA CTC TCC ATG AGA GAG GAG TCA GAT 
Ala Leu Ser Lys Gin Ser Ser Glu Val Ser Met Arg Glu Glu Ser Asp 
■" u 375 380 

JS Sn ^ ^ G ^ GT GAT GAT GGT GAT ACT GAA A CA TCA CCA ACT 
lie Asp Glu Asn Gin Ser Asp Asp Gly Asp Thr Glu Thr Ser Pro Thr 

3 390 395 400 

AAA TCT CCA ACA ACA CCC AAA TCA GTC AAA AAC AAA AAT TCT TCA GAP 
Lys Ser Pro Thr Thr Pro Lys Ser Val Lys Asn A^n sS 2r" SS 
405 410 415 

t TC * CC TAT AAC *AT GGA GTC GTC ATG ACC TCC TGT CGT 

Phe Pro Leu Phe Ser Tyr Asn Asn Gly Val Val Met Thr Ser Cys Arg 

425 430 

°! G GAC ^ ^° CGC AGT GCC raG TCG GCC GCC TCT GCC TTT GCC 
Glu Leu Asp Asn Asn Arg Ser Ala Leu Ser Ala Ala Ser Ala Phe Ala 

440 445 

Se Sa J£ ? £ GCC ^ GAG GGC ACC CCA AAC AAG GAG AAG TAC 
lie Ala Thr Ala Gly Ala Asn Glu Gly Thr Pro Asn Lys Glu Lys Tyr 
* 3U 455 460 



CGG AGG ATG TCC 
Arg Arg Met Ser 
465 

GGA GAC AAG GAG 
Gly Asp Lys Glu 



TTA GCC AGT GCA GGG TTT CCC CCA GAC CAG AGG AAT 
Leu Ala Ser Ala Gly Phe Pro Pro Asp Gin Arg Asn 
470 475 y 4 8 o 

TTT GTG ATC CGC AGA GCA GCC ACC AAT CGT GTC TTG 
Phe Val lie Arg Arg Ala Ala Thr Asn Arg Val Leu 
485 490 495 

CAC TGG GTG TCC AAG CAC TCT CAG GAC TTT GAG ACC 
His Trp Val Ser Lys His Ser Gin Asp Phe Glu Thr 
505 510 

A^n ftl ^ G 0X0 AAA TGC AAG GTG ATC GGC TTC CTG GAA GAA GTC ATG 
Asn Asp Glu Leu Lys Cys Lys Val lie Gly Phe Leu Glu (Si ?a° Me? 
313 520 525 

CAC GAC CCG GAG CTC CTG ACC CAG GAG CGG AAG GCT GCA GCC AAC ATC 
His Asp Pro Glu Leu Leu Thr Gin Glu Arg Lys Ala aS £ H£ £S 
DJU 535 540 



AAC GTG CTC CGC 
Asn Val Leu Arg 
500 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



1392 



1440 



1488 



1536 



1584 



1632 
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ATC AGG ACT CTG ACC CAG GAG GAC CCA GGT 
He Arg Thr Leu Thr Gin Glu Asp Pro Gly 
545 550 

GAG GAG ATC ACG CAG ATG GCT GAA GGC GTG 
Glu Glu He Thr Gin Met Ala Glu Gly Val 
565 570 

AAC CAC TCA GCC CTG GAG ATC GCG GAG CAG 
Asn His Ser Ala Leu Glu He Ala Glu Gin 
580 585 



GAC AAC CAG ATC ACG CTG 
Asp Asn Gin He Thr Leu 
555 560 

AAG GCT GAG CCC TTT GAA 
Lys Ala Glu Pro Phe Glu 
575 

CTG ACC CTG CTA GAT CAC 
Leu Thr Leu Leu Asp His 
590 



15 S vll lit ^ tT T £ CT ™ GAG GAG TTC TTC GGA CAA GGA TGG 

Leu Val Phe Lys Lys He Pro Tyr Glu Glu Phe Phe Gly Gin Gly Trp 

595 600 605 

S ^ F G GAA ^ G AGG ACC CCT TAT ATC ATG AAA ACC ACT 

20 LSU G1U LyS Asn Glu Arg Thr Pro Ile Met Lys Thr Thr 

olu . 615 620 



AAG CAC TTC AAT GAC ATC 
Lys His Phe Asn Asp He 
625 630 

AAT GAG GAC ATC AAC GCC 
Asn Glu Asp He Asn Ala 
645 

GTA GCT GAC ATA TGC CGC 
Val Ala Asp He Cys Arg 
660 



AGT AAC TTG ATT GCT TCA GAA ATC ATC CGC 
Ser Asn Leu He Ala Ser Glu He He Arg 
fi 35 640 

AGG GTG AGC GCC ATC GAG AAG TGG GTG GCC 
Arg Val Ser Ala He Glu Lys Trp Val Ala 
650 655 

TGC CTC CAC AAC TAC AAT GCC GTA CTG GAG 
Cys Leu His Asn Tyr Asn Ala Val Leu Glu 
665 670 



r?f i CC o CG TCC ATG ^ CGC AGT GCA ATC TTC CGG CTC AAA AAG ACG 
35 He Thr Ser Ser Met Asn Arg Ser Ala He Phe Arg Leu i£ £s Thr 

TGG CTC AAA GTC TCT AAG CAG ACT AAA GCT TTG ATT GAT AAG C?r paa 

40 ^ JS LyS Val Ser LyS ?q? >*■ Ala Leu He Sp £Js §K 

695 700 



AAG CTT GTG TCA TCT GAG 
Lys Leu Val Ser Ser Glu 
7 05 710 

AAA AAT TGT GAC CCA CCC 
Lys Asn Cys Asp Pro Pro 
725 

50 GAC CTG GCC TTC ATC GAG 
Asp Leu Ala Phe He Glu 
740 



GGC AGA TTT AAG AAT CTC AGA GAA GCT TTG 
Gly Arg Phe Lys Asn Leu Arg Glu Ala Leu 
715 720 

TGT GTC CCT TAC CTG GGG ATG TAC CTC ACC 
Cys Val Pro Tyr Leu Gly Met Tyr Leu Thr 
730 735 

GAG GGG ACG CCC AAT TAC ACG GAA GAC GGC 
Glu Gly Thr Pro Asn Tyr Thr Glu Asp Gly 
745 750 



CTG GTC AAC TTC TCC AAG ATG AGG ATG ATA TCC CAT ATT ATC CGA GAP 
55 Leu Val Asn Phe Ser Lys Met Arg Met He Ser His iS 55 Sg §S 
bb 760 765 

III a GG ^ CAA CAA ACT GCC TAC AAA ATA GAG CAC CAA GCA AAG 

60 TTO Gln PhS Gln Gln ^ r Ala T * r L ^ S Ile G ^ His Gin Ala Lys 

' /u 775 780 

S? %E ^ ^ AT TOA CTG GAC ^ TCT TTT GTA ATG GAT GAA GAA AGC 
Val Thr Gln Tyr Leu Leu Asp Gln Ser Phe Val Met Asp Glu Glu Ser 



1680 



1728 



1776 



1824 



1872 



1920 



1968 



2016 



2064 



2112 



2160 



2208 



2256 



2304 



2352 



2400 
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15 



20 

785 790 795 800 

CTC TAC GAG TCT TCT CTC CGA ATA GAA CCA AAA CTC CCC ACC TGAAGCTGTG 2452 
Leu Tyr Glu Ser Ser Leu Arg lie Glu Pro Lys Leu Pro Thr 

805 810 815 

CCCAGCCCAG ACCCAGCTGC TCCCGGGGAC ATGTGCTAGA TGATACTGTA CATATTCGTT 2512 

TGGTTTCACT GGATTTTCTT CTTCAGTATG TGCTTCTCCA AGAATACAAA TCGTCCTTGT 2572 

TCTTAGATTC CTGTAGAACC GGAATATGAA TTTCTGCACC GTTTCAGACT TCGCCCACCC 2632 

ATCCCTCCCC TCGCCCGAAT 2652 

(2) INFORMATION POUR LA SEQ ID NO: 2: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
_ (A) LONGUEUR: 814 acides amine 

20 (B) TYPE r acide amine 

(D) CONFIGURATION: lineire 

(ii) TYPE DE MOLECULE: protSne 

25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

Gly Asp Gly Cys Lys He Leu Leu Asp Thr Ser Gin Thr Phe Val Ara 
1 5 10 15 

30 Gin Gly Ser Leu lie Gin Val Pro Met Ser Glu Lys Gly Lys He Thr 
20 25 30 

Arg Gly Arg Leu Gly Ser Leu Ser Leu Lys Lys Glu Gly Glu Arg Gin 
35 35 40 45 

Cys Phe Leu Phe Ser Lys His Leu He He Cys Thr Arg Gly Ser Glv 
50 55 60 

Atx G i£ LyS Leu His Leu Thr L Y S Asn Gly Val He Ser Leu He Asp Cys 
40 65 70 75 80 

Thr Leu Leu Glu Glu Pro Glu Ser Thr Glu Glu Glu Ala Lys Gly Ser 
85 90 '* 95 

45 Gly Gin Asp He Asp' His Leu Asp Phe Lys He Gly Val* Glu Pro Lys 
100 105 110 

Asp Ser Pro Pro Phe Thr Val He Leu Val Ala Ser Ser Arg Gin Glu 
50 "5 120 125 

Lys Ala Ala Trp Thr Ser Asp He Ser Gin Cys Val Gly Asn He Arg 
130 T35 140 * 

^ Asn Gly Leu Met Met Pro phe Glu Glu Asn Ser Lys Val Thr 
35 145 150 155 ^ . 160 

Val Pro Gin Met He Lys Ser Asp Ala Ser Leu Tyr Cys Asp Asp Val 
165 170 175 

60 Asp He Arg Phe Ser Lys Thr Met Asn Ser Cys Lys Val Leu Gin He 
180 r 185 190 

Ala Tyr Ala Ser Val Glu Arg Leu Leu Glu Arg Leu Thr Asp Leu Arg 
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195 



200 



205 



10 



20 



25 



35 



40 



50 



55 



Phe Leu Ser He Asp Phe Leu Asn Thr Phe Leu His Ser Tyr Arg Val 

215 220 

Phe Thr Thr Ala He Val Val Leu Asp Lys Leu He Thr He Tyr Lys 



235 



240 



Lys Pro He Ser Ala He Pro Ala Arg Ser Leu Glu Leu Leu Phe Ala 
24 5 250 



255 



Ser Gly Gin Asn Asn Lys Leu Leu Tyr Gly Glu Pro Pro Lys Ser Pro 
Zb0 265 270 

15 Arg Ala Thr Arg Lys Phe Ser Ser Pro Pro Pro Leu Ser He Thr Lys 

280 285 

Thr Ser Ser Pro Ser Arg Arg Arg Lys Leu Ser Leu Asn He Pro He 



295 



300 



He Thr Gly Gly Lys Ala Leu Asp Leu Ala' Ala Leu Ser Cys Asn Ser 

310 315 320 

Asn Gly Tyr Thr Ser-Met Tyr Ser Ala Met Ser Pro Phe Ser Lys Ala 
■"5 330 335 

Thr Leu Asp Thr Ser Lys Leu Tyr Val Ser Ser Ser Phe Thr Asn Lys 
,s * u 345 350 

30 He Pro Asp Glu Gly Asp Thr Thr Pro Glu Lys Pro Glu Asp Pro Ser 
J0S 360 365 

Ala Leu Ser Lys Gin Ser Ser Glu Val Ser Met Arg Glu Glu Ser Asp 



380 



He Asp Gin Asn Gin Ser Asp Asp Gly Asp Thr Glu Thr 



390 



Ser Pro Thr 



395 400 
Lys Ser Pro Thr Thr Pro Lys Ser Val Lys Asn Lys Asn Ser Ser Glu 

Phe Pro Leu Phe Ser Tyr Asn Asn Gly Val Val Met Thr Ser Cys Arg 

425 430 

45 Glu Leu Asp Asn Asn Arg Ser Ala Leu Ser Ala Ala Ser Ala Phe Ala 



440 445 
He Ala Thr Ala Gly Ala Asn Glu Gly Thr Pro Asn Lys Glu Lys Tyr 



460 



jrg Arg Met Ser Leu Ala Ser Ala Gly Phe Pro Pro Asp Gin Arg Asn 

475 480 

Gly Asp Lys Glu Phe Val lie Arg Arg Ala Ala Thr Asn Arg Val Leu 
485 490 495 

Asn Val Leu Arg His Trp Val Ser Lys His Ser Gin Asp Phe Glu Thr 
500 505 510 

60 Asn Asp Glu Leu Lys Cys Lys Val He Gly Phe Leu Glu Glu Val Met' 

520 525 

His Asp Pro Glu Leu Leu Thr Gin Glu Arg Lys Ala Ala Ala Asn He 
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530 535 540 

lie Arg Thr Leu Thr Gin Glu Asp Pro Gly Asp . Asn Gin He Thr Leu 
5 545 ' 550 555 560 

Glu Glu lie Thr Gin Met Ala Glu Gly Val Lys Ala Glu Pro Phe Glu 
565 570 575 

Asn His Ser Ala Leu Glu He Ala Glu Gin Leu Thr Leu Leu Asp His 
10 580 585 590 

Leu Val Phe Lys Lys He Pro Tyr Glu Glu Phe Phe Gly Gin Glv Tro 
595 600 605 

15 Met Lys Leu Glu Lys Asn Glu Arg Thr Pro Tyr He Met Lys Thr Thr 
61 0 615 620 

Lys His Phe Asn Asp He Ser Asn Leu lie Ala Ser Glu He He Arg 
20 625 630 635 640 

Asn Glu Asp lie Asn Ala Arg Val Ser Ala He Glu Lys Trp Val Ala 
645 650 655 

Val Ala Asp He Cys Arg Cys Leu His Asn Tyr Asn Ala Val Leu Glu 
*° 660 . 665 670 

He Thr Ser Ser Met Asn Arg Ser Ala He Phe Arg Leu Lys Lys Thr 
675 680 685 

30 Trp Leu Lys Val Ser Lys Gin Thr Lys Ala Leu lie Asp Lys Leu Gin 
690 695 700 

Lys Leu Val Ser Ser Glu Gly Arg Phe Lys Asn Leu Arg Glu Ala Leu 
35 705 710 715 720 

Lys Asn Gys Asp Pro Pro Cys Val Pro Tyr Leu Gly Met Tyr Leu Thr 
725 730 735 

Asp Leu Ala Phe He Glu Glu Gly Thr Pro Asn Tyr Thr Glu Asp Glv 
40 740 745 750 

Leu Val Asn Phe Ser Lys Met Arg Met He Ser His He He Arg Glu 
7 55 760 765 

45 He Arg Gin. Phe Gin Gin Thr Ala Tyr Lys He Glu His' Gin Ala Lys 
770 775 780 

Val Thr Gin Tyr Leu Leu Asp Gin Ser Phe Val Met Asp Glu Glu Ser 
50 785 790 795 800 

Leu Tyr Glu Ser Ser Leu Arg He Glu Pro Lys Leu Pro Thr 
805 810. 

55 {2) INFORMATION POOR LA SEQ ID NO: 3: 



60 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 666 acides amine 

(B) TYPE: acide amin§ 

(D) CONFIGURATION: lineire 

(ii) TYPE DE MOLECULE: protene 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

Met Met Lys Pro Phe Glu Glu Asn Ser Lys Val Thr Val Pro Gin Met 
5 5 10 15 

He Lys Ser Asp Ala Ser Leu Tyr Cys Asp Asp Val Asp He Arg Phe 
20 25 30 

Ser Lys Thr Met Asn Ser Cys Lys Val Leu Gin He Ala Tyr Ala Ser 

40 45 

Val Glu Arg Leu Leu Glu Arg Leu Thr Asp Leu Arg Phe Leu Ser He 
b0 55 60 

15 Asp Phe Leu Asn Thr Phe Leu His Ser Tyr Arg Val Phe Thr Thr Ala 
M 70 75 80 

He Val Val Leu Asp Lys Leu lie Thr He Tyr Lys Lys Pro He Ser 
20 .85 90 95 

Ala He Pro Ala Arg Ser Leu Glu Leu Leu Phe Ala Ser Gly Gin Asn 
100 105 no 

25 Asn Lys Leu Leu Tyr Gly Glu Pro Pro Lys Ser Pro Arg Ala Thr Arg 

120 125 

Lys Phe Ser Ser Pro Pro Pro Leu Ser He Thr Lys Thr Ser Ser Pro 
IJU 135 140 

30 Ser Arg Arg Arg Lys Leu Ser Leu Asn He Pro He He Thr Gly Gly 

150 155 160 

Lys Ala Leu Asp Leu Ala Ala Leu Ser Cys Asn Ser Asn Gly Tyr Thr 
35 5 170 175 

Ser Met Tyr Ser Ala Met Ser Pro Phe Ser Lys Ala Thr Leu Asp Thr 
180 185 190 ■ 

Ser Lys Leu Tyr Val Ser Ser Ser Phe Thr Asn Lys He Pro Asp Glu 
133 200 205 

Gly Asp Thr Thr Pro Glu Lys Pro Glu Asp Pro Ser Ala Leu Ser Lys 

215 220 

45 Gin Ser Ser Glu Val Ser Met Arg Glu Glu Ser Asp He Asp Gin Asn 

230 235 240 

Gin Ser Asp Asp Gly Asp Thr Glu Thr Ser Pro Thr Lys Ser Pro Thr 
50 250 255 

Thr Pro Lys Ser Val Lys Asn Lys Asn Ser Ser Glu Phe Pro Leu Phe 
260 265 270 

55 Ser }« Asn Gly Val Val Met Thr Ser Cys Arg Glu Leu Asp Asn 

Asn Arg Ser Ala Leu Ser Ala Ala Ser Ala Phe Ala He Ala Thr Ala 
zau 295 300 

60 Gly Ala Asn Glu Gly Thr Pro Asn Lys Glu Lys Tyr Arg Arg Met Ser 

310 315 320 

Leu Ala Ser Ala Gly Phe Pro Pro Asp Gin Arg Asn Gly Asp Lys Glu 
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325 



330 



335 



10 



20 



35 



40 



50 



Phe Val He Arg Arg Ala Ala Thr Asn Arg Val Leu Asn Val Leu Arg 



345 



350 



His Trp Val Ser Lys His Ser Gin Asp Phe Glu Thr Asn Asp Glu Leu 



350 



365 



Lys Cys Lys Val He Gly Phe Leu Glu Glu Val Met His Asp Pro Glu 



375 



380 



Leu Leu Thr Gin Glu Arg Lys Ala Ala Ala Asn He He Arg Thr Leu 



390 



395 



15 Thr Gin Glu Asp Pro Gly Asp Asn Gin He Thr Leu Glu Glu He 



405 



410 



400 
Thr 



415 



Gin Met Ala Glu Gly Val Lys Ala Glu Pro Phe Glu Asn His Ser Ala 
420 425 . 43 0 

Leu Glu lie Ala Glu Gin Leu Thr Leu Leu Asp His Leu Val Phe Lys 
* J -> 440 



445 



25 ^ 450 ^ G1U GiU 55 PhS Gly Gln Gly Tr P Met Glu 



450 455 460 

Lys Asn Glu Arg Thr Pro Tyr He Met Lys Thr Thr Lys His Phe 



470 



475 



Asn 
480 



30 Asp He Ser Asn Leu He Ala Ser Glu He He Arg Asn Glu Asp He 

485 490 495 



Asn Ala Arg Val Ser Ala He Glu Lys Trp Val Ala Val Ala Asp He 



505 



510 



Cys Arg Cys Leu His Asn Tyr Asn Ala Val Leu Glu He Thr Ser Ser 

520 coc 



525 



Met Asn Arg Ser Ala He Phe Arg Leu Lys Lys Thr Trp Leu Lys Val 

D O d 540 

Ser Lys Gin Thr Lys Ala Leu He Asp Lys Leu Gin Lys Leu Val Ser 

550 555 560 

45 ser Glu Gly Arg Phe" Lys Asn Leu Arg Glu Ala Leu Lys Asn Cys Asp 



570 575 
Pro Pro Cys Val Pro Tyr Leu Gly Met Tyr Leu Thr Asp Leu Ala Phe 



585 



590 



He Glu Glu Gly Thr Pro Asn Tyr Thr Glu Asp Gly Leu Val Asn Phe 



600 



605 



55 m% Met Arg MSt Ile Ser His Ile Ile Ar * Glu He Arg Gin 

°"' u 615 «a 



620 



Gin Gin Thr Ala Tyr Lys He . Glu His Gin Ala Lys Val Thr Gin 



Phe 



Tvr 



630 635 640 



60 Leu Leu Asp Gin Ser Phe Val Met Asp Glu Glu Ser Leu Tyr Glu Ser 

645 * 650 



655 



Ser Leu Arg He Glu Pro Lys Leu Pro Thr 
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50 



55 



25 

660 665 

(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 489 acides amine 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineire 



(ii) TYPE DE MOLECULE: protene 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

15 Met Tyr Ser Ala Met Ser Pro Phe Ser Lys Ala Thr Leu Asp Thr Ser 
1 5 10 15 

Lys Leu Tyr Val Ser Ser Ser Phe Thr Asn Lys He Pro Asp Glu Gly 
20 25 30 

Asp Thr Thr Pro Glu Lys Pro Glu Asp Pro Ser Ala Leu Ser Lys Gin 
3= 40 45 

25 S tn G1U Val Ser Met Glu Glu Ser As P lie Asp Gin Asn Gin 

55 .60 

Ser Asp Asp Gly Asp Thr Glu Thr Ser Pro Thr Lys Ser Pro Thr Thr 
W 70 75 so 

30 Pro Lys Ser Val Lys Asn Lys Asn Ser Ser Glu Phe Pro Leu Phe Ser 

85 90 95 

Tyr Asn Asn Gly Val Val Met Thr Ser Cys Arg Glu Leu Asp Asn Asn 
35 100 105 no 

Arg Ser Ala Leu Ser Ala Ala Ser Ala Phe Ala He Ala Thr Ala Gly 
115 120 125 

40 no Gly Thr Pr ° £2 LyS Glu Lys T * r ^ Ar ? M et Ser Leu 

IJU 135 140 

Ala Ser Ala Gly Phe Pro Pro Asp Gin Arg Asn Gly Asp Lys Glu Phe 

150 1 55 160 

45 Val He Arg Arg Ala Ala Thr Asn Arg Val Leu Asn Val Leu Arg His 

'65 170 i 75 

Trp Val Ser Lys His Ser Gin Asp Phe Glu Thr Asn Asp Glu Leu Lys 

Cys Lys Val He Gly Phe Leu Glu Glu Val Met His Asp Pro Glu Leu 

200 205 

Leu Thr Gin Glu Arg Lys Ala Ala Ala Asn He He Arg Thr Leu Thr 
*' u 215 220 



Gin Glu Asp Pro Gly Asp Asn Gin He Thr Leu Glu Glu He Thr Gin 
5 230 235 240 

60 Met Ala Glu Gly Val Lys Ala Glu Pro Phe Glu Asn His Ser Ala Leu 

245 250 255 

Glu He Ala Glu Gin Leu Thr Leu Leu Asp His Leu Val Phe Lys Lys 



26 



260 265 270 

He Pro Tyr Glu Glu Phe Phe Gly Gin Gly Trp Met Lys Leu Glu Lys 
27 5 280 285 

Asn Glu Arg Thr Pro Tyr He Met Lys Thr Thr Lys His Phe Asn Asp 
290 295 300 

lie Ser Asn Leu lie Ala Ser Glu He lie Arg Asn Glu Asp He Asn 
305 310 315 320 

Ma Arg Val Ser Ala He Glu Lys Trp Val Ala Val Ala Asp He Cys 
325 .330 335 

Arg Cys Leu His Asn Tyr Asn Ala Val Leu Glu lie Thr Ser Ser Met 
340 345 350 

Asn Arg Ser Ala He Phe Arg Leu Lys Lys Thr Trp Leu Lys Val Ser 
355 360 " 365 

Lys Gin Thr Lys Ala Leu He Asp Lys Leu Gin Lys Leu Val Ser Ser 
370 375 380 

Glu Gly Arg Phe Lys Asn Leu Arg Glu Ala Leu Lys Asn Cys Asp Pro 
385 390 395 400 

Pro Cys Val Pro Tyr Leu Gly Met Tyr Leu Thr Asp Leu Ala Phe He 
405 410 415 

Glu Glu Gly Thr Pro Asn Tyr Thr Glu Asp Gly Leu Val Asn Phe Ser 
420 425 430 

Lys Met Arg Met He Ser His He He Arg Glu He Arg Gin Phe Gin 
435 440 445 

Gin Thr Ala Tyr Lys He Glu His Gin Ala Lys Val Thr Gin Tyr Leu 
450 455 460 

Leu Asp Gin Ser Phe Val Met Asp Glu Glu Ser Leu Tyr Glii Ser Ser 
465 470 475. 480 

Leu Arg He Glu Pro Lys Leu Pro Thr 
• 485 

(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1092 paires de bases 

(B) TYPE: acide nucleque 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 



(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1 . .1092 



WO 93/21314 



PCT/FR93/00382 



27 



10 



20 



30 
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45 



50 



60 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

T?f ™? x? A ^ C CAA AGG AAA AAA ATT GCA AGA GAC AAT GGA CCA 48 

lie Thr Lys He He Gin Arg Lys Lys He Ala Arg Asp Asn Gly Pro 
1 5 10 15 

r?3 St T ?** A F 2£* ^ ^ AGT TCA CCT CCC ACA GTT GAG TGG CAT 96 
Gly His Asn He Thr Phe Gin Ser Ser Pro Pro Thr Val Glu Trp His 
20 25 30 



ATA AGC AGA CCT GGG CAC ATA GAG ACT TTT GAC CTG CTC ACC TTA CAC 
He Ser Arg Pro Gly His He Glu Thr Phe Asp Leu Leu Thr Leu His 
13 35 40 45 



Arg Ala Val Gin Pro Ser Asp Leu Val Gly Ser Val Trp Thr Lys Glu 
65 70 75 so 

25 GAC AAA GAA ATT AAC TCT CCT AAT CTT CTG AAA ATG ATT CGA CAT ACC 
Asp Lys Glu He Asn Ser Pro Asn Leu Leu Lys Met He Arg His Thr 
85 90 95 



25 £S ^ £? G AAC ™ AAT GGG GTC CTT GAG GTT GTC AGT 

val Phe Gin Glu Leu Asn Asn Phe Asn Gly Val Leu Glu Val Val Ser 
130 135 140 



CCA TGT GTG CCT TTC TTT GGA ATT TAT CTA CAT AAT ATC TTG AAA ACA 
55 Pro Cys Val Pro Phe Phe Gly lie Tyr Leu His Asn lie Leu Lys Thr 



144 



CCA ATA GAA ATT GCT CGA CAA CTC ACT TTA CTT GAT TCA GAT CTA TAC 1Q? 
Pro lie Glu He Ala Arg Gin Leu Thr Leu Leu Asp Ser Asp Leu Tyr 
50 55 60 

a™ f? T f, TA ^ G TCA GAT ™ GTT GGA AGT GTG TGG ACA AAA GAA 240 



288 



ACC AAC CTC ACT CTG TGG TTT GAG AAA TGT ATT GTA GAA ACT GAA AAT 
Thr Asn Leu Thr Leu Trp Phe Glu Lys Cys He Val Glu ihl Glu 
TOO 105 no 



^ AGA GTA GCT GTG GTG AGT CGA ATT ATT GAG ATT CTA CAA 384 
Leu Glu Glu Arg Val Ala Val Val Ser Arg He lie Glu lie Leu Gin 
}i: > 120 125 



432 



A?» mI° t* T o CC TCA CCT GTT TAC AGA CTA GAC ^ ACA TTT GAG CAA 
Ala Met Asn Ser Ser Pro Val Tyr Arg Leu Asp His Thr Phe Glu Gin 

145 15 ° 155 i 6 o 

ATA CCA AGT CGC CAG AAG AAA ATT TTA GAA GAA GCT CAT GAA TTG AGT 
lie Pro Ser Arg Gin Lys Lys He Leu Glu Glu Ala His Glu Leu Ser 
• 165 170 175 

£ AT AAG TAT TTG GCA AAA CTC AGG TCT ATT AAT CCA 576 

Glu Asp His Tyr j.ys Lys Tyr Leu Ala Lys Leu Arg Ser He Asn Pro 
180 185 190 



480 



528 



624 



Su Glu r?S n CT GAG GT ? CTA *** AGA CAT GGA AAA GAG CTT ATA 672 

Glu Glu Gly Asn Pro Glu Val Leu Lys Arg His Gly Lys Glu Leu He 
210 215 220 

AAC TTT AGC AAA AGG AGG AAA GTA GCA GAA ATA ACA GGA GAG ATC CAG 720 
Asn Phe Ser Lys Arg Arg Lys Val Ala Glu He Thr Gly Glu He Gin 
225 230 235 240 
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CAG TAC CAA AAT CAG CCT TAC TGT TTA CGA GTA GAA TCA GAT ATC AAA 768 
Gin Tyr Gin Asn Gin Pro Tyr Cys Leu Arg Val Glu Ser Asp lie Lvs 
245 250 255 

AGG TTC TTT GAA AAC TTG AAT CCG ATG GGA AAT AGC ATG GAG AGG GAA 816 
Arg Phe Phe Glu Asn Leu Asn Pro Met Gly Asn Ser Met Glu Arg Glu ' 
260 265 270 

TTT ACA GAT TAT CTT TTC AAC AAA TCC CTA GAA ATA GAA CCA CGA AAC 864 
Phe Thr Asp Tyr Leu Phe Asn Lys Ser Leu Glu lie Glu Pro Arg Asn 
2"5 280 285 

CCT AAG CCT CTC. CCA AGA TTT CCA AAA AAA TAT ACG TAT CCC CTA AAA 912 
Pro Lys Pro Leu Pro Arg Phe Pro Lys Lys Tyr Thr Tyr Pro Leu Lys 
290 295 300 

TCT CCT GGT GTC CGG CCA TCA AAC CCA AGA CCG GGT ACC ATG AGG ATC 960 
on fnf r ° Gly Val Pro Ser * sn Pro **g Pro Gly Thr Met Arg lie 
^ 305 310 .315 320 



10 



15 



25 



30 



40 



45 



CCC ACC CCT CTA CAG CAG GAA CCA CGA AAA ATA AGT TAT AGT AGA ATA 1008 
Pro Thr Pro Leu Gin Gin Glu Pro Arg Lys He Ser Tyr Ser Arg lie 
325- 330 335 

CCA GAG TCA GAG ACA GAG AGT ACT GCT AGT GCA CCT AAT TCA CCA AGG 1 056 

Pro Glu Ser Glu Thr Glu Ser Thr Ala Ser Ala Pro Asn Ser Pro Arg 
340 345 350 

ACA CCT CTA ACA CCT CCA CCT GCA TCA GGA ACA TCA i 0 o 2 

Thr Pro Leu Thr Pro Pro Pro Ala Ser Gly Thr Ser 
355 360 



35 (2) INFORMATION POUR LA SEQ ID NO: 6: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 364 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

Cii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 





He Thr 
1 


Lys 


He 


He 
5 


Gin 


Arg 


Lys 


Lys 


lie 
10 


Ala Arg Asp Asn Gly Pro 


50 


Gly His 


Asn 


He 
20 


Thr 


Phe 


Gin 


Ser 


Ser 
25 


Pro 


Pro Thr Val Glu Trp His 
30 




lie Ser 


Arg 
35 


Pro 


Gly 


His 


He 


Glu 
40 


Thr 


Phe 


Asp Leu Leu Thr Leu His 
45 


55 


Pro He 
* 50 


Glu 


He 


Ala 


Arg 


Gin 
55 


Leu 


Thr 


Leu 


Leu Asp Ser Asp Leu Tyr 
60 


60 


Arg Ala 


Val 


Gin 


Pro 


Ser 
70 


Asp 


Leu 


Val Gly 


Ser Val Trp Thr Lys Glu 
75 ~ 80- 




Asp Lys 


Glu 


lie 


Asn 
8 5 


Sfef 


Pro 


Asn 


Leu 


Leu 
90 


Lys Met He Arg His Thr 
95 
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Thr Asn Leu Thr Leu Trp Phe Glu Lys Cys lie Val Glu Thr Glu Asn 
100 105 no 

Leu Glu Glu Arg Val Ala Val Val Ser Arg lie He Glu He Leu Gin 

1 20 i 25 

Val Phe Gin Glu Leu Asn Asn Phe Asn Gly Val Leu Glu Val Val Ser 
IJU 135 140 

10 Ala Met Asn Ser Ser Pro Val Tyr Arg Leu Asp His Thr Phe Glu Gin 
145 150 155 i 60 

He Pro Ser Arg Gin Lys Lys He Leu Glu Glu Ala His Glu Leu Ser 
15 165 1 ?0 175 

Glu Asp His Tyr Lys Lys Tyr Leu Ala Lys Leu Arg Ser He Asn Pro 
180 185 190 

20. ° yS T|s Pr ° Phe Phe Gly f Q * T ** Leu His Asn lie Leu Lys Thr 

Glu Glu Gly Asn Pro Glu Val Leu Lys Arg His Gly Lys Glu Leu He 

215 220 

25 Asn Phe Ser Lys Arg Arg Lys Val Ala Glu He Thr Gly Glu .He Gin 

230 235 240 

Gin Tyr Gin Asn Gin Pro Tyr Cys Leu Arg Val Glu Ser Asp He Lys 
30 245 250 255 

Arg Phe Phe Glu Asn Leu Asn Pro Met Gly Asn Ser Met Glu Arg Glu 
^ ou 265 270 

35 275 ^ 5£ SSr L6U G1U Ile Glu Pro ^ Asn 

J 280 285 

Pro Lys Pro Leu Pro Arg Phe Pro Lys Lys Tyr Thr Tyr Pro Leu Lys 
* u 295 300 

40 Ser Pro Gly Val Arg Pro Ser Asn Pro Arg Pro Gly Thr Met Arg He 

310 315 320 

Pro Thr Pro Leu Gin Gin Glu Pro Arg Lys Ile Ser Tyr Ser Arg He 
45 330 335 

Pro Glu Ser Glu Thr Glu Ser Thr Ala Ser Ala Pro Asn Ser Pro Arg 
J4U 345 

Thr Pro Leu Thr Pro Pro Pro Ala Ser Gly Thr Ser 
3U 355 

(2) INFORMATION POUR LA SEQ ID NO: 7: 



55 



60 



350 



U) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1956 paires de bases 

(B) TYPE: acide nuclSique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
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30 

(iii) ANTI-SENS: NON 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..1956 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

i?2 ™f ^ £° CCA GAG CCA GAA CCT ACA GAA GCA GAT AAA CTA GCA 
Arg Phe Glu He Pro Glu Pro Glu Pro Thr Glu Ala Asp Lys Leu Ala 
5 10 15 



55 60 



125 



TTT GAT CTC ATG ACA CTT CAT CCA ATA GAA ATT GCA CGT GAG CTG ACA 
Phe Asp Leu Met Thr Leu His Pro He Glu He Ala Arg Gin Leu Thr* 



140 



AGA ATT ATA GAA ATT CTG . CAA GTT TTT CGA GAT TTG AAT AAT TTC AAT 



48 



96 



" 5 S ?^ G AAA GGA GAA CAA CCA ATC TCT GCA GAT CTA AAG AGG TTC AGA 
Leu Glu Lys Gly Glu Gin Pro He Ser Ala Asp Leu Lys Arg Phe Arg 
20 25 30 

?ft 2?* ™ AT ATC ^ CCA GTA CAG CTA CGG GTG TTG AAC GTG CAG CGG m 

20 Lys Glu Tyr He Gin Pro Val Gin Leu Arg Val Leu Asn Val Gin 2£ * 
35 40 45 

CAC TGG GTT GAA CAT CAC CCC CAT GAC TTT GAA AGA GAC TTG GAA CTG ,q, 
25 |o 1 **" H±S ^ Phe G1U A 5? ™ Glu Leu 



240 



288 



2u Glu Arn ^ ?" C ^ ACC TCA AGC GCT CAC AGA CCG AAA GCA 

Leu Glu Arg Leu Glu Ser Phe Thr Ser Ser Ala His Arg Ala Lys Ala 

30 ~" 75 80 

ATG AAG AAG TGG GTA GAG AGC ATC GCT AAG ACC ATC AGG AGG AAG AAG 
Met Lys Lys Trp Val Glu Ser lie Ala Lys Thr He Arg Arg Lys LyJ 
85 go 95 

35 GCT ^ GCA ^ GGA GTA AGC CAT AAT ATT ACC TTT GAA AGT CCA 

Gin Ala Gin Ala Asn Gly Val Ser His Asn He Th? Sie ter Pro 336 

100 105 no 

M 001 GCA GCA ACT GAA TGG CAT ATC AGC AAA CCA GGA CAG TTT GAA ACA 1*a 
40 Pro Pro Pro lie Glu Trp His He Ser Lys Pro Gly Gin Phe Glu * 
115 120 



432 



480 



528 



45 130 -135 

CTT TTG GAG TCT GAT CTT TAC AGG AAA GTT CAA CCG TCT GAA CTT GTA 
Leu Leu Glu Ser Asp Leu Tyr Arg Lys Val Gin Pro Sr Su" S Vat 
50 50 155 160 

IS ^ S3? ^ GG ACC AAA GAA GAT AAA GAA ATA AAT TCT CCA AAT TTA 
Gly Ser Val Trp Thr Lys Glu Asp Lys Glu He Asn Ser Pro Asn Leu 
165 170 175 

55 TTA AAA ATG ATT CGC CAT ACC ACA AAT CTC ACC CTC TGG TTT GAA AAA «?7fi 
Leu Lys Met lie Arg His Thr Thr Asn Leu Thr Leu Trp Phe Glu ilS 
180 185 190 . 

60 III t?I S 1 ? 2?* GCA GAA ** T TTT CAA GAA CGG GTG. GCA GTA CTA AGT 624 
60 Cys He Val Glu Ala Glu Asn Phe Glu Glu Arg Val Ala Val Leu Ser 
lys 200 205 



672 
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Arg lie lie Glu lie Leu Gin Val Phe Arg Asp Leu Asn Asn Phe Asn 

215 220 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



GGC GTA TTG GAG ATA GTC 
Gly Val Leu Glu lie Val 
22 5 230 

CTA GAC CAT ACC TTT GAG 
Leu Asp His Thr Phe Glu 
245 

GAC GAA GCT GTG GAA TTA 
Asp Glu Ala Val Glu Leu 
260 



^ ^ T TCA GTG TCA GTA TAC AGA 
Ser Ala Val Asn Ser Val Ser Val Tyr Arg 
235 240 

GCA CTG CAG GAA AGG AAA AGG AAA ATT TTG 
Ala Leu Gin Glu Arg Lys Arg Lys lie Leu 
250 255 

sir ^ T S AC TTT AAA AAA TAC CTA GTA 

Ser Gin Asp His Phe Lys Lys Tyr Leu Val 
265 270 



300 



£s £yt gS L^ HI T A MT TTC AGT **= AGG AGG AAA 

3 ys Lys Gly Lys Asp Leu He Asn Phe Ser Lys Arg Arg Lys 



315 



rft TTa «P °? A GAA ATT GAG TAT CAG AAT CAG CCG TAC 

Glu lie Thr Gly Glu He Gin Gin Tyr Gin jt£ Sn Pro gr 
J " 330 

a™ t? A 5^ CCA GAT ATG AGG AGA TTC 
Arg lie Glu Pro Asp Met Arg Arg Phe 

34 <> 345 

GGA AGT GCA TGT GAA AAA GAG TTT ACA 
Gly Ser Ala Cys Glu Lys Glu Phe Thr 
355 360 

TTA GAA ATA GAA CCA CGA AAT TGT AAA 

SiS Ile Glu Pro Ar 9 Asn Cys Lys 
370 375 



TTT GAA AAC CTT AAC 
Phe Glu Asn Leu Asn 
350 

GAT TAT TTG TTC AAC 
Asp Tyr Leu Phe Asn 
365 

CAG CCA CCA CGA TTT 
Gin Pro Pro Arg Phe 
380 



GTA GCT 
Val Ala 
320 

TGC CTA 
Cys Leu 
335 

CCC ATG 
Pro Met 



AAA AGT 
Lys Ser 



CCA CGA 
Pro Arg 



AAA AGT 
Lys Ser 
385 

CGA CAT 
Arg His 



AGA GAA 
Arg Glu 



GAA AGT 
Glu Ser 



60 CCA GTT 
Pro Val 
450 



2 S 2 2 2 Si 2 2 S 2 2 2 S 2 

395 400 

2 2 2 £ 2 S 2 2 2 2 2 2 2 2 

3 410 415 

£ AT A T A GAA TTT GAA AGA ATA GCT GAA ACA GAA CTA 

Pro Tyr Lys lie Glu Phe Glu Arg He Ala JS Glu S 

425 430 

ACA GTA AGT GCA CCA ACA AGT CCA AAT ACT CCC <PCA in rv-.* 
Thr Val ser Ala Pro Thr Ser Pro A^n £ Pro Ser £ pS 

440 445 

S c CA o CA GAT ^ TCA GTA TTT TTA GAT GTA GAT CTA 

Ser Ala Ser Ser Asp His Ser Val Phe Leu Asp Val Asp Leu 
455 460 



720 



768 



816 



864 



.912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



1392 
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^ ^ 59° GGA AAT ATG AAA TCT GAT GAT GAT CCT 

Asp 
525 



His Asp Gly Ser Asn Ser Lys Gly Asn Met Lys Ser Asp Asp Asp Pro 
13 515 520 



? TG o? G £ AT CTT ^ AGA TCA GAC TGG CTC AGA GAC ATT 
35 Pr ° £2 Gly 1115 ^ ^ Ser Asp Trp Leu Arg Asp lie 

600 605 



ACT ACG TCT CCA AAT TCG CCA AGC ACT CCT CCT AGC ACA CCC TCT CCA 
Ser Thr Cys Pro Asn Ser Pro Ser Thr Pro Pro Ser Thr Pro Ser Pro 
° lu 615 620 

AGG S 3 ^ S CG CCT CGA TGC TAT GTG CTC ACT TCT ACT CAG AAT AAT CT 
Arg val Pro Arg Arg Cys Tyr Val Leu Ser Ser Sex- Gin Asn Asn Leu 
625 630 635. 640 

45 GCT CAT CCT CCA GCT' CCC CCT GTT CCA CCA AGG GAG 
Ala His Pro Pro Ala Pro Pro Val Pro Pro Arg Glu 
645 650 



(2) INFORMATION POUR LA SEQ ID NO: 8: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 652 acides amines 

(B) TYPE: acide amine 

35 (D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Arg Phe Glu He Pro Glu Pro Glu Pro Thr Glu Ala Asp Lys Leu Ma 

1 5 . . . 10 15 * 



1440 



32 

AAC ACT ACT CAC GGA TCA AAC ACA ATC TTT GCA CCT GTG CTA CTA CCA 
Asn Ser Ser His Gly Ser Asn Thr He Phe Ala Pro Val Leu Leu Pro 
465 470 475 480 

AAG TCC AAG TCT TTC TTT AGT TCA TCT GGA ACT TTA CAT AAA CTA AGT 
Lys Ser Lys Ser Phe Phe Ser Ser Cys Gly Ser Leu His Lys 2u sS 
485 490 495 

GAA GAG CCC CTG ATT CCT CCT CCT CTT CCT CCT CGA AAA AAG TTT GAT 1 536 

Glu Glu Pro Leu He Pro Pro Pro Leu Pro Pro Arg Lys Lys Phe Asp 
500 505 5io 



1584 



CCT GCT ATT CCA CCG AGA CAG CCT CCT CCT CCA AAG GTA AAA CCC AGA 1632 
Pro Ala He Pro Pro Arg Gin Pro Pro Pro Pro Lys Val LyS Pro Arg 

GTT CCT GTT CCT ACT GCT GCA TTT GAT GGG CCT CTG CAT AGT CCA CCT 
- Val Pro Val Pro Thr Gly Ala Phe Asp Gly Pro Leu His Ser Pro Pro 
545 550 555 5 6 o 

25 CCG CCA CCA CCA AGA GAT CCT CTT CCT GAT ACC CCT CCA CCA GTT CCC 
Pro Pro Pro Pro Arg Asp Pro Leu Pro Asp Thr Pro Pro Pro Val Pro 
565 570 575 

30 £S a™ £ CT 2°* GAA CAC TTT ATA AAC TGT CCA TTT AAT CTT CAG CCA 1776 
30 Leu Arg Pro Pro Glu His Phe He Asn Cys Pro Phe Asn Leu Gin Pro 
5 »0 585 590 



1680 



1728 



1824 



1872 



1920 



1956 
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Leu Glu Lys Gly Glu Gin Pro lie Ser Ala Asp Leu Lys Arg Phe Arg 
U 25 3 0 

5 Lys. Glu Tyr lie Gin Pro Val Gin Leu Arg Val Leu Asn Val Gin Arg 



45 



His Trp Val Glu His His Pro His Asp Phe Glu Arg Asp Leu Glu Leu 

55 60 

10 Leu Glu Arg Leu Glu Ser Phe Thr Ser Ser Ala His Arg Ala Lys Ala 

U 75 • 80 

Met Lys Lys Trp Val Glu Ser lie Ala Lys Thr He Arg Arg Lys Lys 
15 b 90 95 

Gin Ala Gin Ala Asn Gly Val Ser His Asn lie Thr Phe Glu Ser Pro 
uu 105 1 1© 

20 Pr ° Ha G1U TrP HiS SS Ser Lys Pro G1 * Gln «» Glu Thr 

0 120 12 5 

Phe Asp Leu Met Thr Leu His Pro lie Glu He Ala Arg Gin Leu Thr 

25 Leu Leu Glu Ser Asp Leu Tyr Arg Lys Val Gin Pro Ser Glu Leu Val 

150 155 160 

Gly Ser Val Trp Thr Lys Glu Asp Lys Glu He Asn Ser Pro Asn Leu 
30 165 170 175 

Leu Lys Met lie Arg His Thr Thr Asn Leu Thr Leu Trp Phe Glu Lys 

185 190 

35 ^ 116 IS AU G1U 55 G1U G1U Val ^ Val Leu Ser 

200 205 

Arg lie He Glu He Leu Gin Val Phe Arg Asp Leu Asn Asn Phe Asn 

220 

40 Gly val Leu Glu He Val Ser Ala Val Asn Ser Val Ser Val Tyr Arg 

235 240 
Leu Asp His Thr Phe Glu Ala Leu Gin Glu Arg Lys Arg Lys He Leu 
45 ^ 4S . 250 255 

Asp Glu Ala Val Glu Leu Ser Gin Asp His Phe Lys Lys' Tyr Leu Val 

265 270 
5Q Lys Leu Lys Ser He Asn Pro Pro Cys Val Pro Phe Phe Gly He Tyr 

Leu Thr Asn He Leu Lys Thr Glu Glu Gly Asn Asn Asp Phe Leu Lys 

"3 300 

55 Lys Lys Gly Lys Asp Leu He Asn Phe Ser Lys Arg Arg Lys Val Ala 

315 32 0 
Glu He Thr Gly Glu He Gin Gin Tyr Gin Asn Gin Pro Tyr Cys Leu 
60 330 335 

Arg He Glu Pro Asp Met Arg Arg Phe Phe Glu Asn Leu Asn Pro Met 

3 45 350 
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Gly Ser Ala Cys Glu Lys Glu Phe Thr Asp Tyr Leu Phe Asn Lys Ser 

360 365 

5 ^ So G1U Pr ° ** g ^ Cys L * s . Gln * r ° ^° Arg Phe Pro Arg 

375 380 

|ys Ser Thr Phe Glu Leu Lys Glu Pro Gly He Arg Pro Asn Ala Gly 

395 400 
10 Arg His Gly Glu Thr Ser Gly Thr Arg Gly His Pro Thr Pro Leu Glu 

405 410 4i 5 

Arg Glu Pro Tyr Lys He Glu Phe Glu Arg He Ala Glu Thr Glu Leu 
15 425 430 

Glu Ser Thr Val Ser Ala Pro Thr Ser Pro Asn Thr Pro Ser Thr Pro 

440 445 

20 « J SSr Ala Ser Ser His Ser Val ^e Leu Asp Val Asp Leu 

455 460 

Asn Ser Ser His Gly Ser Asn Thr He Phe Ala Pro Val Leu Leu Pro 

• 47 5 480 

25 Lys Ser Lys Ser Phe Phe Ser Ser Cys Gly Ser Leu His Lys Leu Ser 

" 490 495 

Glu Glu Pro Leu lie Pro Pro Pro Leu Pro Pro Arg Lys Lys Phe Asp 
30 505 510 

His Asp Gly ser Asn Ser Lys Gly Asn Met Lys Ser Asp Asp Asp Pro 

520 525 



35 



60 



Pro Ala He Pro Pro Arg Gin Pro Pro Pro Pro Lys Val Lys Pro Arg 



540 



Val Pro Val Pro Thr Gly Ala Phe Asp Gly Pro Leu His Ser Pro Pro 

40 Pro Pro Pro Pro Arg Asp Pro Leu Pro Asp Thr Pro Pro Pro Val Pro 

3" 57Q 

Leu Arg Pro Pro Glu His Phe He Asn Cys Pro Phe Asn Leu Gin Pro 
45 585 590 

Pro Pro Leu Gly His Leu His Arg Asp Ser Asp Trp Leu Arg Asp He 
Dyz> 600 605 

50 6?0 *"* SSr If? Ser Thr Pro Pr ° Ser Thr Pro Ser Pro 

OID 620 

Arg Val Pro Arg Arg Cys Tyr Val Leu Ser Ser Ser Gin Asn Asn Leu 



55 Ala His Pro Pro Ala 



635 640 



Pro Pro Val Pro Pro Arg Glu 
645 650 



(2) INFORMATION POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE* 

(A) LONGUEUR: 41 bases 

(B) TYPE: acide nucleique 



WO 93/21314 



PCT/FR93/00382 



35 



(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADNc 
(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
GATATCGAAT TCCGIGTIYT IAAYGTIYTI MGICAYTGGG T 

(2) INFORMATION POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE • ' 

(A) LONGUEUR: 34 bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

25 (ii) TYPE DE MOLECULE: ADNc 

(iii) HYPOTHETIQUE: NON 
(iii) ANTI-SENS: NON 



10 



15 



20 



30 



35 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
AAGCTTGAAT TCCKIKKYTT ISWRAARTTI AKIA 
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REVENDICATTONS 

1. Peptide caracterise en ce qu'il ralentit ou inhibe l'echange du GDP sur le 
complexe p21-GDP. 

2. Peptide selon la tevendication 1 caracterise en ce qu f il comprend tout ou 
5 partie des sequences SEQ ID n° 2, 3,4, 6 ou 8 ou d'un derive de ceUes-ci. 

3. Peptide comprenant tout ou partie des sequences SEQ ID n° 2, 3, 4, 6 ou 8 
ou d'un derive de celles-cL 

4. Anticorps ou fragment d'anticorps dirige contre un peptide selon Tune 
quelconque des revendications 1 a 3. 

10 5 - Anticorps ou fragment d'anticorps selon la revendication 4 caracterise en 

ce qu f fl est dirige contre la sequence peptidique SEQ ID n° L 

6. Anticorps ou fragment d'anticorps selon la revendication 5 caracterise en 
ce qu'il possede la capacite d'inhiber au moins partiellement l'echange du GDP sur le 
complexe p21-GDP. 

15 7. Sequence nucleotidique codant pour tin peptide tel que defini dans Tune 

quelconque des revendications 1 a 3. 

8. Sequence nucleotidique selon la revendication 7 caracterisee en ce qu'elle 
est choisie parmi : 

(a) tout ou partie des sequences SEQ ID n° 1, 5 6u 7 ou de leur brin 
20 complementaire, 

(b) toute sequence hybridant avec une sequence (a) et codant pour un 
polypeptide selon Tinvention, et 

(c) les sequences derivees des sequences (a) et (b) en raison de la 
degenerescence du code genetique. 

25 9. Sequence antisens capable d'inhiber au moins partiellement la production • 

de peptides selon la revendication 3. 

10. Sequence nucleotidique capable de s'hydrider avec une sequence selon 
les revendications 7 ou 8 ou avec FARNm correspondanL 
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11. Utilisation d'une sequence selon la revendication 10 pour la detection de 
l'expression du facteur d'echange du GDP ou pour la mise en evidence d'anomalies 
genetiques (mauvais epissage, polymorphisme, mutations ponctuelles, etc). 

12. Utilisation d'un peptide selon l'une quelconque des revendications 1 a 3 
pour la realisation d'un compose non peptidique ou non exclusivement peptidique 
capable de moduler les niveaux d'echange du GDP sur des complexes p21-GDP, par 
determination des elements structuraux de ce peptide qui sont importants pour son 
activite et reproduction de ces 61ements par des structures non peptidiques ou non 
exclusivement peptidiques. 

13. Composition pharmaceutique comprenant comme principe actif au 
moins un peptide selon Tune des revendications 1 a 3 et/ou un anticorps ou fragment 
d'anticorps selon l'une des revendications 4 a 6 et/ou une sequence nucleotidique 
selon la revendication 8 et/ou un compose prepare selon la revendication 12. 

14. Composition pharmaceutique selon la revendication 13 destinee a 
15 moduler l'activation des proteines p21. 

15. Composition pharmaceutique selon la revendication 14 destinee a inhiber 
au moins partiellement l'activation des proteines p21. 

16. Composition pharmaceutique selon la revendication 13 destinee au 
traitement des cancers. 

20 17> Utilisation d'un anticorps ou fragment d'anticorps selon l'une des 

revendications 4 a 6 et/ou d'une sequence nucleotidique selon la revendication 10 
pour la detection de l'expression et/ou d'une surexpression d'un facteur d'echange di 
GDP amplifie, mute ou rearrange dans un echantillon biologique. 

18. Utilisation d'un anticorps ou fragment d'anticorps selon l'une des 
revendications 4 a 6 et/ou d'une sequence nucleotidique selon la revendication 10 
pour le typage de cancers. 

19. Precede de preparation d'un peptide selon l'une quelconque des 
revendications 1 a 3 caracterise en ce que Ton cultive une cellule contenant une 
sequence nucleotidique selon la revendication 7 dans des conditions d'expression de 

30 ladite sequence et on recupere le peptide produit. 
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